# lxml的安装: pip install lxml
# lxml模块的入门使用
# 导入lxml 的 etree 库 (导入没有提示不代表不能用)
from lxml import etree

text = ''' <div> <ul> 
        <li class="item-1"><a href="link1.html">first item</a></li> 
        <li class="item-1"><a href="link2.html">second item</a></li> 
        <li class="item-inactive"><a href="link3.html">third item</a></li> 
        <li class="item-1"><a href="link4.html">fourth item</a></li> 
        <li class="item-0"><a href="link5.html">fifth item</a> 
        </ul> </div> '''

# 利用etree.HTML,将字符串转化为Element对象,
# Element对象具有xpath的方法,返回结果的列表,能够接受bytes类型的数据和str类型的数据
html = etree.HTML(text)
print(type(html))
# 之前再浏览器中使用xpath_helper 是怎么写的xpath 在这里就怎么写即可
# ret_list = html.xpath("xpath字符串")

# 把转化后的element对象转化为字符串,返回bytes类型结果 etree.tostring(element)
# 调用etree.tostring()返回的是bytes类型
html_str = etree.tostring(html).decode()
print(html_str)
